Indexation et représentation comparative : application au discours électoral
نویسنده
چکیده
RESUME. Cet article décrit quelques approches afin d'extraire les termes les plus représentatifs d'un site web ou d'un ensemble de documents en comparaison avec d'autres sites ou un corpus de référence. Nous montrons que la fréquence d'occurrence ou le rang des termes les plus fréquents peut fournir une première synthèse. Notre proposition s'appuie sur une distribution binomiale des mots et le calcul d'un score normalisé (score Z) mettant en lumière les termes comparativement les plus appropriés. Quelques exemples tirés des discours électoraux suisses ou français illustrent l'intérêt de l'approche suggérée.
منابع مشابه
Modélisation de Ressources Termino-Ontologiques en OWL
Résumé : Dans le cadre de recherches menées sur l’indexation sémantique, nous avons été conduits à nous interroger sur l’efficacité générale des modèles actuels de représentation des terminologies au sein des ontologies. Après avoir évoqué leurs limites actuelles, nous proposons un nouveau modèle pour manipuler une ressource termino-ontologique en OWL et nous en décrivons son implémentation pro...
متن کاملUne plateforme de développement d'espaces webs sémantiques communautaires dédiés au partage de ressources multimédia
Résumé. OSIRIS (Ontology-based Systems for Semantic Information Retrieval and Indexation dedicated to communautary and open web Spaces) est un outil dédié au développement d’espaces web communautaires permettant l’annotation et la recherche sémantique de ressources multimédia partagées. Fondé sur l’utilisation d’ontologies denses associées à des thésaurii, OSIRIS permet de décrire sémantiquemen...
متن کاملIndexation de photos sociales par propagation sur une hiérarchie de concepts
Résumé : Nous nommons ‘photos sociales’ les photos qui sont prises lors d’événements familiaux ou de soirées entre amis et qui représentent des individus ou des groupes d’individus. Leur indexation consiste à repérer l’événement et les personnes présentes sur les photos. Dans cet article nous présentons une méthode et des outils pour faciliter cette tâche. De nouvelles photos sont indexées à pa...
متن کاملL'élision du schwa dans les interactions parents-enfant : étude de corpus (Schwa elision in children-parental interactions: A corpus study) [in French]
Le présent article porte sur l'acquisition du schwa en français langue maternelle. À partir de quatre corpus denses d'interaction parents-enfant recueillis en situation naturelle d'interaction, nous analysons la (non) réalisation du schwa dans le discours de deux enfants à deux temps (3;0-3;6 ans et 2;4-3;0 ans) ainsi que dans celui qui leur est adressé. Nous nous sommes plus particulièrement i...
متن کاملReprésentation des expressions calendaires dans les textes : vers une application à la lecture assistée de biographies
In this paper, first we examine the usual treatment of temporal information and we recall the main features relative to the temporality analysis in texts. Then we deal with the formal representation of calendar expressions, and we provide a functional approach, based on a categorical representation of ordinals. Finally, an ongoing application providing a help for the reading of long biography i...
متن کامل